Corpus for Benchmarking Clinical Speech De-identification
プライバシー制約や音声レベルの注釈の複雑さにより不足していた臨床音声の匿名化タスク向けに、英語と中国語の臨床スタイルの音声を 38 種類の機密健康情報カテゴリで時間軸整合的に注釈した「SREDH-AICup 機密健康情報音声コーパス」を構築し、医療音声の自動匿名化研究を支援する基盤を提供した。
193 件の論文
プライバシー制約や音声レベルの注釈の複雑さにより不足していた臨床音声の匿名化タスク向けに、英語と中国語の臨床スタイルの音声を 38 種類の機密健康情報カテゴリで時間軸整合的に注釈した「SREDH-AICup 機密健康情報音声コーパス」を構築し、医療音声の自動匿名化研究を支援する基盤を提供した。
この論文は、臨床データ、バイオマーカー、薬物動態データを統合し、探索的決定支援分析のための再現性のある分析用データセット、可視化、予測モデルを生成する Python ベースのワークフローを開発・実証したものである。
MIMIC-IV データを用いたマルチモーダル機械学習モデルは、構造化データと臨床ノートからの特徴量を統合することで、入院中の高用量オピオイド曝露を高精度に予測し、オピオイド管理の向上に寄与する可能性を示しました。
本論文は、不規則にサンプリングされた臨床データに対して因果推論と時間認識型アテンションを統合した「Time-Aware G-Transformer」を提案し、個人化医療における治療効果の反事実的予測精度と不確実性の較正を大幅に向上させることを示しています。
この混合研究法を用いた研究は、西アフリカの臨床現場における AI 統合の安全性と信頼性を確保するため、独立した規制機関による監視、明確な説明責任、リアルタイムの性能追跡を重視する臨床医の強い要望と懸念を初めて実証的に明らかにしたものである。
本研究は、ホルモン検証済みデータを用いて、自己申告の症状に基づき勾配ブースティングと隠れセミマルコフモデルを組み合わせることで、生理周期の 4 つの位相を精度よく分類する低負担なデジタルバイオマーカー手法の有効性を実証した。
ポルトガルの医療機関で行われたパイロット研究により、臨床現場における AI アシスタント「DR. INFO」が、医師の業務時間削減や意思決定支援において高い満足度と持続的な有用性を示したことが確認されました。
本論文は、医療分野における軽量オープンソース大規模言語モデルの性能を、精度だけでなく推論時間や一貫性などの多角的な指標を用いて包括的に評価するベンチマーク「MedScope」を提案し、これらのモデルが現状では高リスクな医療現場での自律的な展開には至っていないが、透明性のある基盤として価値があることを明らかにしています。
EU における主要な臨床試験スポンサーを対象とした調査により、民間スポンサーはデータ共有の方針や利用契約を具体的かつ公開する傾向があるのに対し、公的スポンサーは高レベルなコミットメントに留まり具体的なガイダンスが不足しているというセクター間の不均衡が明らかになった。
本研究は、介護施設内の非構造化テキストメッセージから Age-Friendly Health Systems の 4M(何よりも重要、薬、認知、移動)情報を抽出するために、微調整済みトークン分類器と大規模言語モデルによる修正を組み合わせた多段階パイプラインを開発・評価し、既存の手法よりも高い精度と効率性を実現したことを示しています。
この論文は、希少腎疾患の患者に関する非構造化臨床記録から血清クレアチニンの経時的な情報を抽出するために、小規模言語モデル(SLM)がルールベースの手法を上回る精度で機能し、プライバシー保護とリソース効率の面で実用的な解決策となり得ることを示しています。
本論文は、既存のベンチマークが医療臨床研究の複雑な要件を考慮していないという課題を解決するため、NHANES や SEER などの公開データと高品質な論文のグランドトゥルースに基づき、統計手法から臨床解釈まで 6 つの医療固有の次元で AI 研究エージェントを評価する初のベンチマーク「MedResearchBench」を提案し、その有効性を実証したものです。
この論文は、アルツハイマー型認知症(ADRD)における行動・社会的要因(BSFs)の知識を統合し、既存のオントロジーを基盤として構築された「BSO-AD」を提案し、専門家レビューと大規模言語モデル(LLM)を活用した評価によりその有効性と自動評価の可行性を実証したものである。
本論文は、希少疾患データベースの構築を通じて開発された多層構造の検証パイプライン「VaaS」が、AI 支援科学における引用ハルシネーションをほぼゼロに抑制し、生産規模での低コストかつ高信頼な実装を可能にしたことを報告しています。
本論文は、臨床イベントシーケンスから患者固有の解釈可能な表現を学習する時間認識型トランスフォーマー「ClinicalTAAT」を提案し、小児救急コホートでの評価により、既存のプロセスマイニング手法を補完し、医療評価と最適化のためのスケーラブルな基盤モデルとして機能することを示しています。
スイス小児病院の電子健康記録から成長データを抽出する「SwissPedGrowth」プロジェクトは、データ抽出の実現性と高品質性を示したが、病院間でのデータ完全性と調和の課題が残っている。
本論文は、臨床意思決定における逐次的情報提示下での大規模言語モデルの推論病理を可視化・定量化する新規診断センサー(SIPS)を開発し、単発評価では検出できない「アクセス - 安定性の乖離」や「収縮的躊躇のパラドックス」といった構造的な失敗モードを解明し、AI の透明性と安全性のガバナンス要件を数値化可能な指標へと変換する包括的な評価フレームワークを提案しています。
本論文は、予測性能とモデル多様性を同時に最適化する多目的アンサンブル融合フレームワーク「MOE-ECG」を提案し、心電図データから心房細動を高精度かつ頑健に検出可能であることを示した。
この論文は、複数の臨床試験において、協調的なフィードバックに基づく自動学習機能を備えた人間と AI の連携型チャットボットを用いた患者スクリーニングが、低コストかつ高い精度で実現可能であることを示しています。
本論文は、不規則な電子カルテイベントの構造と時間的依存関係を双層トランスフォーマーで効率的に学習し、多様な臨床タスクにおいて既存手法を上回る予測性能を発揮する事前学習フレームワーク「HealthFormer」を提案するものである。